| Integrantes | Código | Participación |
|---|---|---|
| Guerrero Vásquez, Ana Paula | 202010138 | 100% |
| San Martín Amarrortu, Maria Paula | 202010390 | 100% |
| García Rodriguez, Karol Adriana | 202010262 | 100% |
| Camasca Tapara, Jhon David | 201920106 | 100% |
| Campos Castañeda, Brandon Jesús | 202010465 | 100% |
| Vila Centeno, Lennin Cristopher | 201610403 | 100% |
A inicios del ciclo 2022-1, luego de dos años de virtualidad tras la pandemia del Covid-19, la Universidad de Tecnología e Ingeniería (UTEC) se vio en la posibilidad de retornar a un presencialidad gradual, la cual se completó a mediados de dicho periodo. Fue así que un gran número de estudiantes, maestros y administrativos, mayor al de años anteriores a la pandemia, empezamos a encontrarnos cada día en el campus. Ello ha conllevado a que los diversos espacios sean cada vez más visitados y, en consecuencia, a que tengamos la necesidad de trasladarnos a lo largo de los 13 pisos principales (contándose los 2 sótanos). Como resultado, se percibieron múltiples quejas de los usuarios acerca de los ascensores, sobre todo con respecto a los tiempos de espera, dada la alta demanda de los mismos en ciertos horarios. Por ello, el presente proyecto busca caracterizar las diversas variables que involucran el uso de este servicio, así como evaluar los problemas de interés encontrados en el proceso.
Para conocer más la dinámica, se debe saber que UTEC cuenta con dos “torres” (una cercana a la puerta principal y la otra ubicada más al fondo). En cada una de ellas se ubican 4 ascensores que toman como denominación las letras A, B, C y D. A diferencia de la mayoría de ascensores donde encuentras solo dos botones (para subir o bajar) y dentro de la cabina seleccionas el piso correspondiente, en este caso se encuentran paneles afuera donde el usuario indica el piso de destino y se le da a conocer el ascensor al cual deberá esperar. Los ascensores funcionan todo el día; no obstante, el número de usuarios interesados en usar este servicio a lo largo del tiempo no es un valor conocido, pues serán diversas variables las que intervendrán en sus decisiones.
Figura N°1. Vista panorámica de la UTEC
Como se puede inferir de la descripción general, el tiempo de llegada de los usuarios, así como el tiempo entre llegadas, puede ser modelado mediante una variable aleatoria (no determinística), es decir, son parte de un proceso estocástico. Así mismo, con el fin de conocer el número de unidades que llegan al sistema en hasta cierto instante de tiempo, se deberá realizar un conteo (discreto). Para ello, es importante señalar que la llegada de las unidades puede hacer referencia a quienes llegan de manera individual, así como quienes lo hacen de forma grupal (2 o más personas). De igual modo, como resultado de la observación y experiencia, se sabe que el modelo de llegada es no estacionario, ya que la llegada de personas al sistema varía en distintos momentos del día, ya sea si se compara mediante mañana, tarde y noche, o si se hace la diferenciación a lo largo de una hora específica. Los ascensores se bifurcan en cuatro estaciones, siendo estos los cuatro ascensores para los cuales se puede considerar que se forman 4 colas distintas.
Figura N°2. Vista a los ascensores de la UTEC
Los clientes o usuarios a los que está dirigido el uso del ascensor son principalmente el alumnado o personal de la misma universidad. Por lo que no habría distinción entre ellos, porque usan el ascensor con el mismo objetivo. No obstante, podemos percatarnos que existen dos tipos de comportamiento:
El usuario que espera a su ascensor, al cual lo denominaremos como TIPO A.
El usuario que luego de un largo tiempo o la capacidad del ascensor se retire del proceso, al cual denominaremos como TIPO B.
Figura N°3. Vista a los ascensores con cola de la UTEC
a) Disciplina de servicio en cada una de las estaciones en donde la unidad reciba los servicios
La atención de los ascensores se puede modelar como un proceso estocástico pues tiene un tiempo de servicios variables. El proceso empieza con la llegada de un individuo al área dónde se encuentran los ascensores, no obstante, para el estudio tomaremos como primera estación la elección del piso al que se desean trasladar. El servicio de atención de la primera estación es de forma individual, y se puede observar la disciplina de llegada (FCFS), lo que se traduce a “First Come First Served” y quiere decir que el primero en llegar, será atendido primero. En la segunda estación, es decir los ascensores, la atención puede ser de manera individual o en grupos dependiendo del día y la hora. Es en esta estación en la que se generan colas, siendo de mayor magnitud en las “horas pico” y dificultando el proceso.
b) Disciplina de atención en cada una de las colas
A diferencia de las colas “normales” donde las unidades se ubican una detrás de la otra, aquí las personas se forman como aglomeraciones. No obstante, ello no evita que se den los distintos fenómenos que ocurren en las colas. Por ejemplo, suele darse que algunos usuarios estén esperando al ascensor designado, pero notan que llega otro ascensor que va al mismo piso o a uno cercano al que se quieren dirigir y optan por entrar a este, lo cual podríamos considerar como una especie de “jockeying” pues es como si se cambiara de cola. Así mismo, también sucede que tras la haber marcado al piso y asignarles un ascensor, se dan cuenta que ya hay mucha gente haciendo cola para el mismo, por lo cual optan por irse del sistema, siendo posible que finalmente usen las escaleras para subir. Dichas unidades son llamadas “frustrados”. De igual modo, están los “renegados” quienes también dejan el sistema, pero ellos lo hacen tras una larga espera por su ascensor que no llega o lo hace muy lleno.
c) Capacidad del sistema
La capacidad del sistema se calcula según la cantidad de ascensores y la cantidad de peso que esta puede soportar.
Figura N°4. Los ascensores de UTEC gráficados de manera minimalista
Cada ascensor tiene una capacidad de 1600 kilos, al ser cuatro ascensores, el sistema tiene capacidad de 6400 kilos en total.
Cada ascensor tiene una capacidad de 21 personas, al ser cuatro ascensores, el sistema tiene capacidad de 84 personas en total.
Figura N°5. Cartel de capacidad
d) Número de canales del servicio
Según lo señalado en los planos de construcción de la UTEC, hay dos zonas orientadas para ubicar los ascensores. Cada zona, o mejor conocido como “Torre 1” y “Torre 2”, posee una disponibilidad de cuatro (4) ascensores con las mismas condiciones indicadas en la “Capacidad del sistema”. Entonces, contamos con ocho (8) ascensores a disposición del alumnado y personal administrativo de UTEC. Además, cada piso posee paneles para seleccionar el piso a donde se quiera ir, cada zona posee dos (2) paneles. Exceptuando el primer piso que posee cuatro (4) paneles en cada torre.
Al observar el comportamiento de los canales previamente mencionados, podemos decir que es un sistema multicanal (Multichannel queuing system) que permite tener una cola de espera en cada canal. Esto se puede ver al momento en que un grupo de estudiantes desean trasladarse en la universidad. Formándose una (1) cola para cada panel.
Figura N°6. Multichannel queuing system
Por parte de las colas formadas para cada ascensor, podemos percatarnos que poseen un comportamiento parecido a un canal de servicio de cola típico (Typical queuing process). Esto es debido a que, en la estación anterior, se derivó al estudiante al ascensor indicado formando este comportamiento en la cola.
Figura N°6. Typical queuing process
Por lo que podemos decir que existen dos (2) tipos de comportamiento de filas en las dos estaciones indicadas.
e) Número de estaciones de servicio
Como se mencionó en el anterior inciso, se puede evidenciar la existencia de dos (2) estaciones en el servicio de ascensores de la UTEC.
Estación de Paneles: En esta estación, el usuario selecciona el piso donde se quiere dirigir y espera una respuesta del panel, donde le indica a que ascensor debe esperar para llegar a su destino. Como se mencionó, en el primer piso hay una diferencia, la cual es la disponibilidad de cuatro (4) paneles a diferencia de los anteriores pisos de dos (2), en cada torre.
Estación de la espera del ascensor: En esta estación, el usuario luego de ser derivado por la estación anterior, se dirige a la zona de espera del ascensor asignado, ya sea, ascensor “A”, ascensor “B”, ascensor “C” o ascensor “D”. Donde se realizará la cola correspondiente para el ingreso al ascensor correspondiente. Se podría decir que esta estación posee cuatro (4) subcanales.
Figura N°7. Esquema de las estaciones del proceso de los ascensores
| Número de pregunta | Interrogante | Variable de interés | Relevancia |
|---|---|---|---|
| Preg. 1 | ¿Cuál es la torre con mayor flujo de personas? | Cantidad de personas en un intervalo de tiempo | Esta variable nos ayudará a saber en que torre hay más afluencia de personas, es relevante porque nos ayudará a tomar medidas o plantear soluciones para evitar tener una torre sobrecargada. |
| Preg. 2 | ¿Cantidad máxima de tiempo de espera? | Tiempo entre llegadas | Esta variable es importante porque se podrá saber cuanto es el máximo de tiempo de espera que se da en el sistema, si el tiempo de espera es muy alto será un indicador para plantear soluciones. |
| Preg. 3 | ¿La probabilidad de que las personas lleguen en grupos mayores a 3? | Variable grupo | La relevancia de esta pregunta es importante porque si la probabilidad de llegar en grupo es muy alta quiere decir que el canal puede no ser suficiente para satisfacer la demanda de los alumnos porque el ascensor nos considera la llegada de grupos y si a varios grupos les toca un mismo canal, habrá un problema. |
| Preg. 4 | ¿Cuál es el tiempo promedio total desde que un alumno ingresa al sistema hasta que salga del sistema? | Tiempo total en el sistema | Esta pregunta no permite saber cuánto se demora normalmente una persona en llegar a su destino, a pesar de que el tiempo de viaje en el ascensor es determinístico esta pregunta nos ayuda a mapear cuántos alumnos salen del sistema fuera del promedio. |
| Preg. 5 | ¿Cuál es la probabilidad de que una persona que viaja en un canal distinto llegue más rápido a un mismo piso que otra persona en otro canal? | Duración del servicio | Esta pregunta es útil para saber si los canales se están distribuyendo correctamente o si algunas están siendo saturadas por temas programación de la empresa encargada. |
Categóricas
Piso: Esta variable puede variar de 1 al 11. Debido a la cantidad de pisos disponibles en la estructura.
Canal: Esta variable puede variar entre A, B, C y D.
Torre: Esta variable puede variar entre “Torre A” y “Torre B”.
Numéricas
Tiempo de llegada al ascensor: Esta variable nos va a servir para saber a que en que momento nuestro usuario entra al proceso. (En segundos)
Tiempo entre llegadas: Esta variable nos va a servir para ver cuanto tiempo hay entre cada nuevo usuario. (En segundos)
Tiempo en la estación de espera: Esta variable nos va servir para saber cuanto es el tiempo de espera antes de ser atendido (entrar al ascensor). (En segundos)
Tiempo de total en el proceso: Esta variable nos sirve para saber el tiempo total que un usuario este dentro del proceso. (En segundos)
a) Plantilla utilizada para el Pre-muestreo
A partir de la cooperación entre los otros grupos, se ha acordado usar una plantilla parecida a esta:
Figura N°8. Plantilla usada para el Pre-muestreo
Para llenar la plantilla, el grupo se ha posicionado en el piso 1, en cada torre, a la 13:42:00 y tomó la muestra respectiva por 30 minutos.
## # A tibble: 10 x 14
## NUM_CLI PISO CANAL TORRE H_LLEGADAS H_ATENCION T_SERVICIO TIEMPO_ENTRE_LLEG~
## <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 1 7 D A 40 41 1 0
## 2 2 11 A B 53 54 1 13
## 3 3 6 A B 59 60 1 6
## 4 4 7 C A 101 102 1 42
## 5 5 11 C A 113 114 1 12
## 6 6 6 C A 120 121 1 7
## 7 7 8 D A 121 122 1 1
## 8 8 10 D A 122 123 1 1
## 9 9 8 C B 127 128 1 5
## 10 10 4 C B 127 128 1 0
## # ... with 6 more variables: H_LLEGADASA <dbl>, H_ATENCIONA <dbl>,
## # T_SERVICIOA <dbl>, H_SALIDA <dbl>, T_T_PROCESO <dbl>, TIPO_C <chr>
Como se logra observar, durante el tiempo previamente dicho, se ha obtenido una cantidad de 100 datos. Por lo que podemos decir que nuestro lambda = 100 usuarios/30 minutos.
A partir de los datos obtenidos, podemos usarlo para hallar nuestro tamaño de muestra.
b) Calculo del tamaño de muestra
Para comenzar, formularemos nuestro tamaño de muestra con la tolerancia y confianza. A continuación, despejaremos la “n” para obtener la ecuación a utilizar para nuestro cálculo:
\(\text{P}(|\bar{X}_{n}-\mu|<T)\geq (1- \alpha)\)
\(\text{P}(|\frac{\bar{X}_{n}-\mu}{\frac{\sigma}{\sqrt{n}}}|<\frac{T}{\frac{\sigma}{\sqrt{n}}})\geq (1- \alpha)\)
\(\text{Por el teorema central del límite}\)
\(\Phi(\frac{T}{\frac{\sigma}{\sqrt{n}}})-\Phi(-\frac{T}{\frac{\sigma}{\sqrt{n}}})\geq (1-\alpha)\)
\(2\Phi(\frac{T}{\frac{\sigma}{\sqrt{n}}})-1\geq (1-\alpha)\)
\(\Phi^{-1}(\Phi(\frac{T}{\frac{\sigma}{\sqrt{n}}}))\geq \Phi^{-1}(\frac{1+(1-\alpha)}{2})\)
\(\text{n}\geq(\frac{\sigma}{T}\times(\Phi^{-1}(\frac{1+(1-\alpha)}{2})))^{2}\)
Teniendo en cuenta la fórmula, podemos aplicarla con diferentes confianzas para ajustarla a nuestras necesidades. Aclarando que el resultado de cada variable de interés va a ser diferente, debido a que poseen desviaciones estándares diferentes. Por lo que el tamaño de la muestra mínima que se va a seleccionar va a ser la mayor de todas. A partir de esto, se procede a calcular el tamaño de muestra de cada una de las variables relevantes.
## Variables_Importantes Desviacion_Estandar_seg media_seg Confianza
## 1 Tiempo de llegada al ascensor 499.75 856.52 0.95
## 2 Tiempo entre llegadas 18.73 17.60 0.95
## 3 Tiempo en la estación de espera 53.91 55.29 0.95
## 4 Tiempo de total en el proceso 53.94 93.55 0.95
## Tolerancia_seg Tamanio_Muestra
## 1 85.65 131
## 2 1.76 435
## 3 5.53 365
## 4 9.36 128
Como podemos percatarnos, vamos a elegir el tamaño de muestra mayor entre todas nuestras variables 435 datos.
Ya que sabemos que por 30 minutos tenemos 100 personas. Por lo que tendremos que 2.175 horas, es decir, 2 horas con 10 minutos con 30 segundos.
Dado que los grupos decidieron seguir una misma plantilla, los datos se van a tomar de manera colaborativa el día Lunes 21 de Noviembre desde las 13:10:00 hasta las 15:52:19. Debido a que entre todos quedamos en tener 500 datos, es decir, entre todos nos quedamos 02:49:19 para conseguir la DATA.
Figura N°8. Plantilla usada para el Muestreo Colaborativo
## # A tibble: 10 x 16
## NUM_CLI PISO TORRE CANAL GRUPO H_LLEGADA H_ATENCION T_SERVICIO
## <dbl> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 1 7 B A 1 18 18 1
## 2 2 9 A C 1 23 23 1
## 3 3 5 B A 1 43 43 1
## 4 4 7 A A 1 67 67 1
## 5 5 10 A C 1 98 98 1
## 6 6 5 B D 2 107 107 1
## 7 7 10 A C 1 115 115 1
## 8 8 11 A C 3 116 116 1
## 9 9 10 B D 4 142 142 1
## 10 10 6 A C 1 169 169 1
## # ... with 8 more variables: T_ENTRE_LLEGADA <dbl>, H_LLEGADAA <dbl>,
## # H_ATENCIONA <dbl>, T_SERVICIOA <dbl>, H_SALIDA <dbl>, T_T_PROCESO <dbl>,
## # TIPO_C <chr>, T_ESPE_ASC <dbl>
Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 6.00 12.50 19.44 26.00 164.00
Según lo que podemos ver, nuestro tiempo mínimo es de 0.0 segundos y el tiempo máximo fue de 164 segundos. Entonces, el Tiempo entre llegadas varía en 164 segundos. Además, podemos decir que los datos se concentran entre [6.00;26.00] segundos.
La media/promedio de los datos es de 12.50 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha. También, podemos observar los datos atípicos.
Viéndolo desde un histograma:
En relación al tiempo entre llegada podemos observar que la frecuencia más alta se ve en los primeros intervalos, mientra va disminuyendo de manera progresiva, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo exponencial.
AT.1.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con el modelo exponencial y esto se refleja en ambas gráficas presentadas.
AT.1.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 0 max: 164
## median: 12.5
## mean: 19.438
## estimated sd: 20.28263
## estimated skewness: 2.424366
## estimated kurtosis: 11.87371
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.05757965
## Cramer-von Mises statistic 0.24547880
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 3969.230
## Bayesian Information Criterion 3973.445
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.05144562 0.002299848
Como observamos en la arriba, solo nos salen los parámetros para la exponencial y los gráficos señalan que se acerca mucho a una exponencial. Por lo que vamos a decir que se puede modelar como una exponencial. Además, que el Chi cuadrado tiene un P-value de 0.288 y el kstest no lo rechaza.
AT.1.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una exponencial.
\(H_0= \text{Se distribuye como una exponencial}\)
\(H_1= \text{No se distribuye como una exponencial}\)
## Warning in ks.test(F9, "pexp", (fitdist(DF1$T_ENTRE_LLEGADA, "exp")$estimate)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: F9
## D = 0.05758, p-value = 0.07263
## alternative hypothesis: two-sided
Como se logra apreciar el P-value es mayor al 0.05, puesto que estamos aplicando una confianza del 0.95. Así que se acepta la hipótesis nula.
\(\text{Tiempo entre Llegadas = }exp(0.05144562 \times t)\)
AT.2.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18 2812 4586 4756 6874 9737
En el boxplot no notamos ningún dato atípico, por lo que nuestros datos no se ven alterados. El Tiempo de llegada en su mayoría está en el intervalo [2812;6874], este intervalo en segundos.
Realizamos un histograma para tener las primeras nociones a identificar a que modelo conocido se distribuye.
Viéndolo desde un histograma:
Notamos que hay cierta similitud a un modelo uniforme y para confirmarlo haremos una gráfica de Cullen and Frey y analizar cómo se modelan los tiempos de llegadas.
descdist(F6,discrete=FALSE, boot=500)
## summary statistics
## ------
## min: 18 max: 9737
## median: 4586
## mean: 4755.83
## estimated sd: 2667.764
## estimated skewness: 0.02435328
## estimated kurtosis: 1.978526
Apreciamos que la observación se encuentra precisamente en la distribución uniforme. Para encontrar los parámetros que maximicen la función uniforme haremos uso del comando fitdist de R.
## Fitting of the distribution ' unif ' by maximum likelihood
## Parameters:
## estimate Std. Error
## min 18 NA
## max 9737 NA
La función fitdist nos lanza los siguientes parámetros de a=18 y b=9737 para los tiempos de llegada. Ahora realizamos un plot de la data con el modelo uniforme.
plot(tdellegadas_unif)
Vemos que en cada gráfica los datos se aproximan de manera correcta a la distribución uniforme. Del mismo modo, usaremos la función gofsat para verificar por medio del k.test lo siguiente:
\(H_0= \text{Se distribuye como una uniforme}\)
\(H_1= \text{No se distribuye como una uniforme}\)
Validacion_Tiempo_llegadas <- gofstat(tdellegadas_unif)
Validacion_Tiempo_llegadas
## Goodness-of-fit statistics
## 1-mle-unif
## Kolmogorov-Smirnov statistic 0.04897973
## Cramer-von Mises statistic 0.36537011
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-unif
## Akaike's Information Criterion 9185.838
## Bayesian Information Criterion 9194.267
Como se logra apreciar el P-value se aproxima a 0.05, puesto que estamos aplicando una confianza del 0.95. Por lo que se podría rechazar la hipótesis nula. Sin embargo, al ser un proyecto aplicado en la vida real y con todos los antecedentes gráficos mostrados validamos la hipótesis nula. Por lo tanto, tiene una distribución uniforme.
AT.3.1. Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 12.00 28.00 39.49 55.00 229.00
Según lo que podemos ver, nuestro tiempo mínimo es de 0.0 segundos y el tiempo máximo fue de 229 segundos. Entonces, el Tiempo de espera del ascensor varía en 229 segundos. Además, podemos decir que los datos se concentran entre [12.00;55.00] segundos.
La media/promedio de los datos es de 39.45 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha.
También, podemos observar los datos atípicos y eso lo podemos justificar, por ejemplo, que el usuario llego justo después que el ascensor halla cerrado sus puertas.
Viéndolo desde un histograma:
En relación al tiempo entre llegada podemos observar que la frecuencia más alta se ve en los primeros intervalos, mientra va disminuyendo de manera progresiva, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo exponencial.
AT.3.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con el modelo exponencial y esto se refleja en ambas gráficas presentadas.
AT.3.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 0 max: 229
## median: 28
## mean: 39.488
## estimated sd: 37.87578
## estimated skewness: 1.769411
## estimated kurtosis: 6.967893
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.04993326
## Cramer-von Mises statistic 0.17398644
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 4677.997
## Bayesian Information Criterion 4682.211
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.02532415 0.001130761
Como observamos en la arriba, solo nos salen los parámetros para la exponencial y los gráficos señalan que se acerca mucho a una exponencial. Por lo que vamos a decir que se puede modelar como una exponencial. Caso parecido al modelamiento de la primera variable.
AT.3.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una exponencial.
\(H_0= \text{Se distribuye como una exponencial}\)
\(H_1= \text{No se distribuye como una exponencial}\)
## Warning in ks.test(F16, "pexp", (fitdist(F16, "exp")$estimate)): ties should not
## be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: F16
## D = 0.049933, p-value = 0.1652
## alternative hypothesis: two-sided
Como se logra apreciar el P-value es mayor al 0.05, puesto que estamos aplicando una confianza del 0.95. Así que se acepta la hipótesis nula.
\(\text{Tiempo de espera del ascensor = }exp(0.02534854 \times t)\)
AT.4.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.00 44.00 60.00 69.88 88.00 263.00
Según lo que podemos ver, nuestro tiempo mínimo es de 5.0 segundos y el tiempo máximo fue de 263.0 segundos. Entonces, el Duración Total del servicio del ascensor varía en 258 segundos. Además, podemos decir que los datos se concentran entre [44.00;88.00] segundos.
La media/promedio de los datos es de 70.36 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha.También, podemos observar los datos atípicos.
Viéndolo desde un histograma:
En relación a la duración total podemos observar que la frecuencia más alta se encuentra entre [25;75], mientras va aumentando al llegar al intervalo y disminuyendo de manera progresiva cuando se aleja del intervalo, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo gamma.
AT.4.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con una gamma y esto se refleja en ambas gráficas presentadas.
AT.4.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 4 max: 263
## median: 60
## mean: 69.884
## estimated sd: 39.73896
## estimated skewness: 1.512711
## estimated kurtosis: 6.278993
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.2606768
## Cramer-von Mises statistic 10.2486856
## Anderson-Darling statistic 53.6657980
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 5248.837
## Bayesian Information Criterion 5253.051
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.01430943 0.0006367937
Como podemos observar, los datos no estas sobre la línea de tendencia. Por lo que si la elegimos, tendriamos un mayor error al momento de simular. Por ello, pasamos al siguiente modelo para observar si se ajusta de una mejor manera.
## Goodness-of-fit statistics
## 1-mle-gamma
## Kolmogorov-Smirnov statistic 0.05520442
## Cramer-von Mises statistic 0.31226581
## Anderson-Darling statistic 1.81008052
##
## Goodness-of-fit criteria
## 1-mle-gamma
## Akaike's Information Criterion 4949.286
## Bayesian Information Criterion 4957.715
## Fitting of the distribution ' gamma ' by maximum likelihood
## Parameters:
## estimate Std. Error
## shape 3.42886616 0.206820047
## rate 0.04907175 0.003186243
Como observamos en la arriba, los datos se ajustan de una mejor manera a la línea de tendencia lo que nos indica que es una mejor aproximación a nuestro modelo ideal para la variable, pero usaremos una prueba adicional para confirmalo por completo.
AT.4.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una gamma.
\(H_0= \text{Se distribuye como una gamma}\)
\(H_1= \text{No se distribuye como una gamma}\)
## Warning in ks.test(F14, "pgamma", (fitdist(F14, "gamma")$estimate)): ties should
## not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: F14
## D = 0.99794, p-value < 2.2e-16
## alternative hypothesis: two-sided
A pesar de que se rechace la hipótesis nula. Vamos a considerar esta distribución, puesto que es a la que más se asemeja y por tema de facilidad de operaciones.
Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 7.00 13.00 20.29 27.00 164.00
Según lo que podemos ver, nuestro tiempo mínimo es de 0.0 segundos y el tiempo máximo fue de 164 segundos. Entonces, el Tiempo entre llegadas varía en 164 segundos. Además, podemos decir que los datos se concentran entre [7.00;27.00] segundos.
La media/promedio de los datos es de 20 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha. También, podemos observar los datos atípicos.
Viéndolo desde un histograma:
En relación al tiempo entre llegada podemos observar que la frecuencia más alta se ve en los primeros intervalos, mientra va disminuyendo de manera progresiva, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo exponencial.
A.1.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con el modelo exponencial y esto se refleja en ambas gráficas presentadas.
A.1.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 0 max: 164
## median: 13
## mean: 20.29155
## estimated sd: 20.99519
## estimated skewness: 2.440913
## estimated kurtosis: 12.13018
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.07395692
## Cramer-von Mises statistic 0.30590153
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 2753.000
## Bayesian Information Criterion 2756.838
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.04928161 0.002659861
Como observamos, solo nos salen los parámetros para la exponencial y los gráficos señalan que se acerca mucho a una exponencial. Por lo que vamos a decir que se puede modelar como una exponencial. Además, que el P-value es de 0.07 y el kstest no lo rechaza.
A.1.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una exponencial.
\(H_0= \text{Se distribuye como una exponencial}\)
\(H_1= \text{No se distribuye como una exponencial}\)
## Warning in ks.test(A9, "pexp", (fitdist(DA$T_ENTRE_LLEGADA, "exp")$estimate)):
## ties should not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: A9
## D = 0.073957, p-value = 0.04693
## alternative hypothesis: two-sided
Obtenemos un p-value de 0.046, valor cercano a 0.05. Con evidencias gráficas podemos corroborar que no podemos rechazar la hipótesis nula. Por lo tanto, concluimos que sigue una distribución exponencial.
\(\text{Tiempo entre Llegadas Torre A = }exp(0.04928161 \times t)\)
A.2.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 23 2920 4974 4944 7022 9737
En el boxplot no notamos ningún dato atípico, por lo que nuestros datos no se ven alterados. El Tiempo de llegada en su mayoría está en el intervalo [2920;7022], este intervalo en segundos.
Realizamos un histograma para tener las primeras nociones a identificar a que modelo conocido se distribuye.
Viéndolo desde un histograma:
Notamos que hay cierta similitud a un modelo uniforme y para confirmarlo haremos una gráfica de Cullen and Frey y analizar cómo se modelan los tiempos de llegadas.
descdist(A6,discrete=FALSE, boot=500)
## summary statistics
## ------
## min: 23 max: 9737
## median: 4974
## mean: 4943.65
## estimated sd: 2619.821
## estimated skewness: -0.05571217
## estimated kurtosis: 2.01585
Apreciamos que la observación se encuentra precisamente en la distribución uniforme. Para encontrar los parámetros que maximicen la función uniforme haremos uso del comando fitdist de R.
## Fitting of the distribution ' unif ' by maximum likelihood
## Parameters:
## estimate Std. Error
## min 23 NA
## max 9737 NA
La función fitdist nos lanza los siguientes parámetros de a=23 y b=9737 para los tiempos de llegada.
Ahora realizamos un plot de la data con el modelo uniforme.
plot(tdellegadasA_unif)
Vemos que en cada gráfica los datos se aproximan de manera correcta a la distribución uniforme. Del mismo modo, usaremos la función gofsat para verificar por medio del ks.test lo siguiente:
\(H_0= \text{Se distribuye como una uniforme}\)
\(H_1= \text{No se distribuye como una uniforme}\)
Validacion_Tiempo_llegadasA <- gofstat(tdellegadasA_unif)
Validacion_Tiempo_llegadasA
## Goodness-of-fit statistics
## 1-mle-unif
## Kolmogorov-Smirnov statistic 0.0759188
## Cramer-von Mises statistic 0.3214897
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-unif
## Akaike's Information Criterion 6302.388
## Bayesian Information Criterion 6310.063
Como se logra apreciar el P-value es 0.07, puesto que estamos aplicando una confianza del 0.95. Por lo que no se rechaza la hipótesis nula. Por lo tanto con todos los antecedentes gráficos mostrados y el p-value, validamos tiene una distribución uniforme.
A.3.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 15.00 33.00 43.54 60.00 229.00
Entonces, sobre el Tiempo de espera del ascensor de la Torre Apodemos decir que los datos se concentran entre [15.00;60.00] segundos.
La media/promedio de los datos es de 43.54 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha.
También, podemos observar los datos atípicos y eso lo podemos justificar, por ejemplo, que el usuario llego justo después que el ascensor haya cerrado sus puertas.
Viéndolo desde un histograma:
En relación al tiempo entre llegada podemos observar que la frecuencia más alta se ve en los primeros intervalos, mientra va disminuyendo de manera progresiva, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo exponencial.
A.3.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con el modelo exponencial y esto se refleja en ambas gráficas presentadas.
A.3.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 0 max: 229
## median: 33
## mean: 43.53644
## estimated sd: 40.24477
## estimated skewness: 1.598447
## estimated kurtosis: 6.070949
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.05060018
## Cramer-von Mises statistic 0.15173180
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 3276.688
## Bayesian Information Criterion 3280.526
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.02296926 0.001237868
Como observamos en la arriba, solo nos salen los parámetros para la exponencial y los gráficos señalan que se acerca mucho a una exponencial. Por lo que vamos a decir que se puede modelar como una exponencial. Caso parecido al modelamiento de la primera variable.
A.3.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una exponencial.
\(H_0= \text{Se distribuye como una exponencial}\)
\(H_1= \text{No se distribuye como una exponencial}\)
## Warning in ks.test(A16, "pexp", (fitdist(A16, "exp")$estimate)): ties should not
## be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: A16
## D = 0.0506, p-value = 0.3436
## alternative hypothesis: two-sided
Como se logra apreciar el P-value es mayor al 0.05, puesto que estamos aplicando una confianza del 0.95. Así que se acepta la hipótesis nula.
\(\text{Tiempo de espera del ascensor = }exp(0.02296926 \times t)\)
A.4.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.0 45.0 63.0 73.8 94.0 263.0
Según lo que podemos ver, nuestro tiempo mínimo es de 4.0 segundos y el tiempo máximo fue de 263.0 segundos. Entonces, el Duración Total del servicio del ascensor en la Torre A varía en 259 segundos. Además, podemos decir que los datos se concentran entre [45.00;94.00] segundos.
La media/promedio de los datos es de 73 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha.También, podemos observar los datos atípicos.
Viéndolo desde un histograma:
En relación a la duración total podemos observar que la frecuencia más alta se encuentra entre [25;75], mientras va aumentando al llegar al intervalo y disminuyendo de manera progresiva cuando se aleja del intervalo, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo gamma.
A.4.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con una gamma y esto se refleja en ambas gráficas presentadas.
A.3.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 4 max: 263
## median: 63
## mean: 73.79592
## estimated sd: 42.15932
## estimated skewness: 1.326604
## estimated kurtosis: 5.47948
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.2498061
## Cramer-von Mises statistic 6.4642219
## Anderson-Darling statistic 33.9868989
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 3638.694
## Bayesian Information Criterion 3642.532
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.01355089 0.0007276688
Como podemos observar, los datos no estas sobre la línea de tendencia. Por lo que si la elegimos, tendríamos un mayor error al momento de simular. Por ello, pasamos al siguiente modelo para observar si se ajusta de una mejor manera.
## Goodness-of-fit statistics
## 1-mle-gamma
## Kolmogorov-Smirnov statistic 0.05479638
## Cramer-von Mises statistic 0.15798932
## Anderson-Darling statistic 0.91882533
##
## Goodness-of-fit criteria
## 1-mle-gamma
## Akaike's Information Criterion 3452.726
## Bayesian Information Criterion 3460.401
## Fitting of the distribution ' gamma ' by maximum likelihood
## Parameters:
## estimate Std. Error
## shape 3.19004743 0.231508714
## rate 0.04323146 0.003395877
Como observamos en la arriba, los datos se ajustan de una mejor manera a la línea de tendencia lo que nos indica que es una mejor aproximación a nuestro modelo ideal para la variable, pero usaremos una prueba adicional para confirmarlo por completo.
A.3.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una gamma.
\(H_0= \text{Se distribuye como una gamma}\)
\(H_1= \text{No se distribuye como una gamma}\)
## Warning in ks.test(A14, "pgamma", (fitdist(A14, "gamma")$estimate)): ties should
## not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: A14
## D = 0.99703, p-value < 2.2e-16
## alternative hypothesis: two-sided
En conclusión, con los antecedentes podemos llegar a que sigue una distribución gamma.
Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 5.00 12.00 17.57 23.00 119.00
Según lo que podemos ver, nuestro tiempo mínimo es de 0.0 segundos y el tiempo máximo fue de 119 segundos. Entonces, el Tiempo entre llegadas varía en 119 segundos. Además, podemos decir que los datos se concentran entre [5.00;23.00] segundos.
La media/promedio de los datos es de 17.57 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha. También, podemos observar los datos atípicos.
Viéndolo desde un histograma:
En relación al tiempo entre llegada podemos observar que la frecuencia más alta se ve en los primeros intervalos, mientra va disminuyendo de manera progresiva, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo exponencial.
B.1.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con el modelo exponencial y esto se refleja en ambas gráficas presentadas.
B.1.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 0 max: 119
## median: 12
## mean: 17.57325
## estimated sd: 18.55905
## estimated skewness: 2.324524
## estimated kurtosis: 10.47198
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.05732484
## Cramer-von Mises statistic 0.03724086
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 1216.043
## Bayesian Information Criterion 1219.099
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.05690468 0.004540085
Como observamos en la arriba, solo nos salen los parámetros para la exponencial y los gráficos señalan que se acerca mucho a una exponencial. Por lo que vamos a decir que se puede modelar como una exponencial. Además, que los puntos de los datos empíricos tienen la misma tendencia del modelo en cuestión.
B.1.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una exponencial.
\(H_0= \text{Se distribuye como una exponencial}\)
\(H_1= \text{No se distribuye como una exponencial}\)
## Warning in ks.test(B9, "pexp", (fitdist(B9, "exp")$estimate)): ties should not
## be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: B9
## D = 0.057325, p-value = 0.6806
## alternative hypothesis: two-sided
Como se logra apreciar el P-value es mayor al 0.05, puesto que estamos aplicando una confianza del 0.95. Así que se acepta la hipótesis nula.
\(\text{Tiempo entre Llegadas = }exp(0.05690468 \times t)\)
B.2.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18 2198 4253 4345 6412 9735
En el boxplot no notamos ningún dato atípico, por lo que nuestros datos no se ven alterados. El Tiempo de llegada en su mayoría está en el intervalo [2198;6412], este intervalo en segundos.
Realizamos un histograma para tener las primeras nociones a identificar a que modelo conocido se distribuye.
Viéndolo desde un histograma:
Notamos que hay cierta similitud a un modelo uniforme y para confirmarlo haremos una gráfica de Cullen and Frey y analizar cómo se modelan los tiempos de llegadas.
descdist(B6,discrete=FALSE, boot=500)
## summary statistics
## ------
## min: 18 max: 9735
## median: 4253
## mean: 4345.497
## estimated sd: 2733.373
## estimated skewness: 0.2197403
## estimated kurtosis: 1.999062
Apreciamos que la observación se encuentra cercana a la distribución uniforme. Para encontrar los parámetros que maximicen la función uniforme haremos uso del comando fitdist de R.
## Fitting of the distribution ' unif ' by maximum likelihood
## Parameters:
## estimate Std. Error
## min 18 NA
## max 9735 NA
La función fitdist nos lanza los siguientes parámetros de a = 18 y b = 9735 para los tiempos de llegada. Ahora realizamos un plot de la data con el modelo uniforme.
plot(Btdellegadas_unif)
Vemos que en cada gráfica los datos se aproximan de manera cercana a la distribución uniforme. Del mismo modo, usaremos la función gofsat para verificar por medio del k.test lo siguiente:
\(H_0= \text{Se distribuye como una uniforme}\)
\(H_1= \text{No se distribuye como una uniforme}\)
BValidacion_Tiempo_llegadas <- gofstat(Btdellegadas_unif)
BValidacion_Tiempo_llegadas
## Goodness-of-fit statistics
## 1-mle-unif
## Kolmogorov-Smirnov statistic 0.1139529
## Cramer-von Mises statistic 0.6041702
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-unif
## Akaike's Information Criterion 2887.033
## Bayesian Information Criterion 2893.145
Como se logra apreciar el P-value es mayor a 0.05, puesto que estamos aplicando una confianza del 0.95. Por lo que se podría aceptar la hipótesis nula. Por lo tanto, tiene una distribución uniforme.
\(\text{Tiempo de llegadas = }Unif(18, 9735)\)
B.3.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 9.00 23.00 30.64 42.00 193.00
Según lo que podemos ver, nuestro tiempo mínimo es de 0.0 segundos y el tiempo máximo fue de 193 segundos. Entonces, el Tiempo de espera del ascensor varía en 193 segundos. Además, podemos decir que los datos se concentran entre [9.00;42.00] segundos.
La media/promedio de los datos es de 30.64 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha.
También, podemos observar los datos atípicos y eso lo podemos justificar, por ejemplo, que el usuario llego justo después que el ascensor halla cerrado sus puertas.
Viéndolo desde un histograma:
En relación al tiempo entre llegada podemos observar que la frecuencia más alta se ve en los primeros intervalos, mientra va disminuyendo de manera progresiva, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo exponencial.
B.3.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con el modelo exponencial y esto se refleja en ambas gráficas presentadas.
B.3.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 0 max: 193
## median: 23
## mean: 30.64331
## estimated sd: 30.38556
## estimated skewness: 2.207461
## estimated kurtosis: 10.52227
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.08280255
## Cramer-von Mises statistic 0.15375238
## Anderson-Darling statistic Inf
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 1390.638
## Bayesian Information Criterion 1393.694
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.03263355 0.002601992
Como observamos en la arriba, solo nos salen los parámetros para la exponencial y los gráficos señalan que se acerca mucho a una exponencial. Por lo que vamos a decir que se puede modelar como una exponencial. Caso parecido al modelamiento de la primera variable.
B.3.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una exponencial.
\(H_0= \text{Se distribuye como una exponencial}\)
\(H_1= \text{No se distribuye como una exponencial}\)
## Warning in ks.test(B16, "pexp", (fitdist(B16, "exp")$estimate)): ties should not
## be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: B16
## D = 0.082803, p-value = 0.2319
## alternative hypothesis: two-sided
Como se logra apreciar el P-value es mayor al 0.05, puesto que estamos aplicando una confianza del 0.95. Así que se acepta la hipótesis nula.
\(\text{Tiempo de espera del ascensor = }exp(0.03263355 \times t)\)
B.4.1.Análisis descriptivo
A partir de un gráfico de caja, podemos ver lo siguiente:
## Warning in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...):
## "horizontal" is not a graphical parameter
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 11.00 41.00 55.00 61.34 74.00 226.00
Según lo que podemos ver, nuestro tiempo mínimo es de 11.0 segundos y el tiempo máximo fue de 226.0 segundos. Entonces, el Duración Total del servicio del ascensor varía en 215 segundos. Además, podemos decir que los datos se concentran entre [41.00;74.00] segundos.
La media/promedio de los datos es de 61.34 segundos para la variable en estudio, representado con la línea roja. Y, que esta es mayor que la mediana (línea negra), lo que nos indica el sesgo hacia la derecha.También, podemos observar los datos atípicos.
Viéndolo desde un histograma:
En relación a la duración total podemos observar que la frecuencia más alta se encuentra entre [25;100], mientras va aumentando al llegar al intervalo y disminuyendo de manera progresiva cuando se aleja del intervalo, lo cual corresponde con el comportamiento de una variable aleatoria que sigue un modelo gamma.
B.4.2.1 Curva teórica vs histograma
Para realizar esta comparación, compararemos la distribución de densidad y acumulativa de los datos recogidos en el tamaño de muestra:
Gracias a la cantidad de datos tomados, podemos ver una similitud con una gamma y esto se refleja en ambas gráficas presentadas.
B.4.2.2 Gráfica Cullen y Frey
Para verificar que tan fiable es nuestro análisis anterior, nos ayudaremos de la gráfica Cullen y Frey:
## summary statistics
## ------
## min: 11 max: 226
## median: 55
## mean: 61.33758
## estimated sd: 32.3664
## estimated skewness: 2.013601
## estimated kurtosis: 9.650088
Como observamos en la gráfica, nuestros datos tienen una tendencia a ser una distribución exponencial y gamma. Por lo que hacemos un ajuste para ver en cual entraría nuestra variable.
## Goodness-of-fit statistics
## 1-mle-exp
## Kolmogorov-Smirnov statistic 0.3110685
## Cramer-von Mises statistic 4.2524825
## Anderson-Darling statistic 21.8645345
##
## Goodness-of-fit criteria
## 1-mle-exp
## Akaike's Information Criterion 1608.547
## Bayesian Information Criterion 1611.604
## Fitting of the distribution ' exp ' by maximum likelihood
## Parameters:
## estimate Std. Error
## rate 0.01630322 0.001296222
Como podemos observar, los datos no están sobre la línea de tendencia. Por lo que si la elegimos, tendríamos un mayor error al momento de simular. Por ello, pasamos al siguiente modelo para observar si se ajusta de una mejor manera.
## Goodness-of-fit statistics
## 1-mle-gamma
## Kolmogorov-Smirnov statistic 0.07972012
## Cramer-von Mises statistic 0.14912415
## Anderson-Darling statistic 0.96295909
##
## Goodness-of-fit criteria
## 1-mle-gamma
## Akaike's Information Criterion 1481.538
## Bayesian Information Criterion 1487.651
## Fitting of the distribution ' gamma ' by maximum likelihood
## Parameters:
## estimate Std. Error
## shape 4.4958299 0.489256195
## rate 0.0732992 0.008437889
Como observamos en la arriba, los datos se ajustan de una mejor manera a la línea de tendencia lo que nos indica que es una mejor aproximación a nuestro modelo ideal para la variable, pero usaremos una prueba adicional para confirmarlo por completo.
B.4.2.3 Prueba Kolmogorov - Smirnov
A partir de esta prueba vamos a confirmar de forma total si se distribuye como una gamma.
\(H_0= \text{Se distribuye como una gamma}\)
\(H_1= \text{No se distribuye como una gamma}\)
## Warning in ks.test(B14, "pgamma", (fitdist(B14, "gamma")$estimate)): ties should
## not be present for the Kolmogorov-Smirnov test
##
## One-sample Kolmogorov-Smirnov test
##
## data: B14
## D = 0.99363, p-value < 2.2e-16
## alternative hypothesis: two-sided
A pesar de que no acepta la hipótesis nula. Podemos usar este distribución, porque en la vida real no siempre va a coincidir con un modelo de distribución como en este caso.
\(\text{Duración Total del servicio del ascensor = }gamma(t,4.4958299,0.0732992)\)
Fundamentals of Queweing Theory Fourth Edition. By D.Gross, J. F. Shortle, J. M. Thompson, and C. M. Harris Copyright, 2008 Jhon Wiley & Sons, Inc.